Menetapkan Standar Emas: MSE
Untuk mengukur seberapa jauh tebakan kita $T$ dari kenyataan $\psi(\theta)$, kita mendefinisikan Mean Squared Error (Definisi 6.3.1):
$$MSE_\theta(T) = E_\theta((T - \psi(\theta))^2)$$
Ini adalah jarak kuadrat rata-rata antara penduga kita dan target. Penduga sempurna akan memiliki MSE nol, tetapi di dunia penuh gangguan acak, kita berusaha meminimalkannya.
Teorema 8.1.1: Arsitektur Kesalahan
Mengapa suatu penduga gagal? Teorema 8.1.1 memberikan gambaran umum. Jika $T$ memiliki momen kedua yang terbatas, kesalahan relatif terhadap konstanta apa pun $c$ diberikan oleh:
Rumus ini mengungkap bahwa kesalahan kuadrat total diminimalkan hanya ketika kita memilih $c = E(T)$. Dalam konteks inferensi, kita menetapkan $c = \psi(\theta)$, yang mengarah pada dekomposisi terkenal:
MSE = Varians + Bias$^2$
Pertukaran Antara Presisi dan Akurasi
Bayangkan dua timbangan di laboratorium kontrol kualitas:
- Relik Presisi: Ia memberikan berat yang sama setiap kali (varians rendah), tetapi terkalibrasi salah sebesar 2 gram (bias tinggi).
- Sang Bijak yang Tak Teratur: Ia benar secara rata-rata (bias nol), tetapi berayun liar antar pengukuran (varians tinggi).
Teorema 8.1.1 memungkinkan kita menghitung secara tepat timbangan mana yang memberikan kesalahan total lebih rendah. Seringkali, kita bersedia menerima deviasi sistematis kecil (bias) jika hal itu secara signifikan mengurangi gangguan (varians).
Contoh 8.1.1: Kepuasan dan Informasi
Optimalitas dikaitkan dengan Informasi. Pertimbangkan ruang sampel $S = \{1, 2, 3, 4\}$. Jika hasil 2, 3, dan 4 sama-sama mungkin di bawah setiap parameter yang mungkin, mereka membawa kemungkinan yang sama. Kita dapat mendefinisikan statistik yang cukup $U$ yang mengelompokkan hasil ini tanpa kehilangan kemampuan untuk membuat inferensi optimal. Seperti yang ditunjukkan simulasi, jika $L(\cdot|2) = L(\cdot|3) = L(\cdot|4)$, penduga optimal memperlakukan ini sebagai satu peristiwa informatif tunggal.